#Prompt Engineering

2天前

llm 能不能“说人话”，更多是底层模型层面的特点，而不是靠“prompt engineering”可以解决的。 gpt-5 系列模型“不说人话”，之前很多人试过很多prompt，即使感觉有效，很多时候都是感觉而已。现在，gpt-5.1 从底层模型上尝试解决“说人话”问题。这才是正确的方向。同一个prompt，gpt-5.1 thinking 的回答，解释更清楚，使用更少的行话术语，更少晦涩复杂表达，更多“说人话”。

OpenAI GPT-5发布引发用户不满，阿尔特曼回应质疑· 142 条信息

#LLM #GPT-5.1 #说人话 #底层模型 #Prompt Engineering

3天前

这个提示词价值不大，是一场精心的营销，目的是为了卖课，不过这个帖子的讨论本身是有价值的。下面的内容是 AI 辅助总结，提示词见评论： ---- （打开编辑器，泡上一杯咖啡）朋友们，今天 Reddit r/ChatGPT 上的一个热帖，可以说是“信息量与槽点齐飞”。起因是，一位老兄发帖宣称，自己在 2025 年“测试了 1000 多个 ChatGPT Prompt”之后，终于找到了一个“能持续击败其他所有框架”的“必胜公式”。他将其命名为 DEPTH 方法。在深入看社区的“花式吊打”之前，我们必须先理解这个“靶子”是什么。什么是 DEPTH 公式？这位老兄（下称 OP）提出的 DEPTH，是一个用于构建“超级 Prompt”的缩写框架： - D - Define Multiple Perspectives (定义多重视角)：别只说“写个邮件”，而要说“你现在是三个专家：一个行为心理学家、一个直效营销文案和一个数据分析师。请你们合作……” - E - Establish Success Metrics (建立成功指标)：别只说“写好点”，而要说“目标是 40% 的打开率、12% 的点击率，必须包含 3 个心理学触发点。” - P - Provide Context Layers (提供上下文)：别只说“为我公司写”，而要说“背景：我们是 B2B SaaS，月费 200 刀，目标是过度劳累的创始人……” - T - Task Breakdown (任务拆解)：别只说“搞个活动”，而要说“第一步：识别痛点。第二步：制造钩子。第三步：构建价值。第四步：软性 CTA。” - H - Human Feedback Loop (人类反馈闭环)：别接受第一版答案，而要说“请从 1-10 分为你的回答打分... 低于 8 分的请自行改进。如果你不确定某些事实，标记为 [UNCERTAIN] 并解释原因。” OP 甚至给出了一个“战绩”：用这个方法生成的 LinkedIn 帖子，拿到了 14% 的参与度和 47 条评论。表面上看，这套理论非常结构化、非常“专业”，对吧？然而，当这套“屠龙术”被扔进 HN（Reddit）这个“试炼场”时，社区的反应却远非“顶礼膜拜”。这场讨论迅速演变成了对当前 Prompt Engineering 乱象的一次“集体会诊”。我为大家提炼了三个核心的交锋点。焦点一：公式虽好，但为何产出的还是“AI 口水话”？这场讨论的第一个转折点，来自一位叫 FineInstruction1397 的用户。他“学以致用”，真的把 OP 那个关于“AI 取代工作”的 LinkedIn 帖子例子扔给了 ChatGPT。结果呢？他得到了这么一段： > “ChatGPT 没在抢工作。它在抢‘借口’。 > …… > AI 不会淘汰工人——它只会淘汰浪费。 > …… > ⚡ 学习 AI 的 CEO 将取代那些不学习的。 > 你是想被取代——还是被放大？” 这……怎么说呢。社区的反应非常直接。一位用户的评论（by jmlusiardo）一针见血：“这简直是‘不是 A，而是 B’这种 ChatGPT 陈词滥调（clichés）的大杂烩。” 另一位用户 BrooklynNets 在看到另一个类似例子后，更是火力全开：“这根本就是一堆充斥着破折号和无意义 emoji 的‘垃圾’（slop）。它就像一个 LinkedIn 帖子和一条 Instagram 字幕生下来的私生子，我的大脑已经被训练到可以自动划过这种内容了。” 这立刻引爆了讨论区的核心焦虑：为什么我们用了如此复杂、精妙的 Prompt 公式，得到的却依然是这种“一眼假”的、充满“AI 味儿”的平庸内容？ OP 显然没有（或者说，回避了）回答这个问题。焦点二：真正的“老炮儿”，是如何让 AI “说人话”的？当 OP 的“必胜公式”被证明无法解决“AI 味儿”这个核心痛点时，真正有价值的讨论开始了。社区里的“老炮儿”们纷纷亮出了自己的“独门秘籍”。这才是这场讨论的“金矿”所在。秘籍一：“以毒攻毒”，用 AI 对抗 AI 用户 ophydian210 提出了一个非常“黑客”的思路： > “永远不要用同一个 AI 来生成内容和清理内容。这里面偏见太重了。 > 我会用 Gemini 2.5 或 Chat 5（编者注：指代当时的先进模型）来跑我的复杂 Prompt，然后把产出的内容，原封不动地扔给 Claude，让它来重写和润色。” 这个“套娃”策略瞬间点醒了很多人。利用不同模型之间的“偏见”差异（Bias）来进行交叉验证和“去味”，这显然比 OP 那个自嗨的“H - 反馈闭环”要高明得多。秘籍二：“喂投”胜过“指令” OP 的方法论核心是“下指令”（Instructions）。但多位用户指出，对于“风格”和“语气”这种微妙的东西，“给例子”（Examples）远比“下指令”有效。就像用户 Sequoia93 说的：“（高质量的）例子胜过指令。” 用户 TheOdbball 补充得更具体：“（AI 的）训练数据有问题。你必须把你自己的东西写下来，做成 Markdown 文件，喂给你的 LLM（比如放到一个写作文件夹里），然后告诉它：‘就按这个风格写，但要写得更好’。” 秘籍三：拆解“说人话”的精细指令库用户 Rasputin_mad_monk 显然对 OP 的粗糙框架很不满。他直接甩出了自己珍藏的“自然语言指令库”，展示了什么才叫“精细活”： - 自然语言与流畅度：“像和熟人聊天一样重写这个”、“像在喝咖啡时和同事聊天一样解释这个”。 - 情感连接：“增加回复的温度，同时保持专业性”、“用更具同理心和理解力的方式重述”。 - 个性化触感：“多用‘你’和‘我们’让内容更个人化”。 - 技术平衡：“简化技术信息，但保持准确性”、“像一个专家在进行随意交谈那样解释”。对比一下，OP 那个“建立成功指标”的指令，显得多么生硬和机械。焦点三：这是“屠龙术”，还是一场“营销秀”？随着讨论的深入，社区的“牛鬼蛇神”们开始扒 OP 的“底裤”。用户 keepcalmandmoomore 发出了最强烈的质疑：“你声称‘测试’了 1000 多个 Prompt？你的测试方法是什么？你如何客观地给每一个目的都不同的 Prompt 打分？” 用户 mafudge 紧随其后：“没有公布测试方法论，就不可信。” 这时，讨论的性质变了。大家开始意识到，这可能根本不是一次诚恳的“经验分享”，而是一次精心策划的“内容营销”。 - 它有一个朗朗上口的缩写（DEPTH）。 - 它声称解决了所有人的痛点（“必胜公式”）。 - 它给出了一个（可能杜撰的）惊人战绩（“14% 参与度”）。果不其然，当有用户问“我能不能把我糟糕的 Prompt 自动转换成你的 DEPTH 格式”时，OP（Over_Ask_7684）兴奋地回复：“当然！我已经为你创建了一个手把手的指南，快去我‘个人简介里的链接’查看吧！” 图穷匕见。正如用户 Historical_Ad_481 的总结：“果然，最后还是个营销广告。” 我们的总结：框架是死的，人是活的这场讨论从一个“必胜公式”开始，最后演变成了一场对“AI 时代内容创作”的深刻反思。 OP 提出的 DEPTH 框架本身有错吗？其实没错。它很好地总结了“结构化 Prompt”的精髓——即从“模糊的聊天”转向“清晰的简报（Briefing）”。这确实是 Prompt Engineering 的第一课。然而，社区之所以“震怒”，是因为 OP 将其包装为“终极答案”来贩卖焦虑和课程。而 HN（Reddit）社区的集体智慧告诉我们： 1. 没有“银弹”：在“AI 味儿”和“人类创造力”的博弈中，没有一劳永逸的公式。 2. “协作”而非“指挥”：正如用户 Gabe_at_Descript 所言，真正高明的用法，是把 AI 当作“创意团队”来“协作”，而不是当作“机器”来“指挥”。 3. “验证”重于“生成”：AI 负责辅助（Assist），人类负责验证（Validate）。真正的价值核心，永远在 OP 公式里的最后一步——“H”（Human Feedback Loop），而这恰恰是 OP 最不重视、只想用 AI 自动化的环节。归根结底，这个所谓的“DEPTH”框架，或许只达到了“深度”的表皮。而真正的深度，藏在社区那些“喂投”、“套娃”和“精细指令”的实战经验里。你对这个 DEPTH 框架怎么看？你又有哪些让 AI “说人话”的独门技巧？不妨在评论区聊聊。

#ChatGPT #Prompt Engineering #AI内容创作 #营销炒作 #AI味

1周前

“prompt engineering”与“大词可厌” --- 对于非开发者来说，80%的prompt 其实都是一件事：和llm对话。所谓“prompt engineering”，其实就是结构化表达，表达清楚自己的想法和需求。在llm出现之前，人们就一直在说话。只要一个人有结构化表达、费曼式表达的意识，能把自己的想法或需求说出来，说清楚，那ta一定能善用llm。过度推崇“prompt engineering”，就好像把“好好说话”推崇为“语言工程”（language engineering）一样，虽然你不能说他错了，甚至不好反驳，但是： “大词可厌！”（大词太过，到了让人讨厌的程度🤣）（没人会否定prompt/说话的重要性，本推只是讨论夸大prompt engineering为灵丹妙药的营销号、或者prompt玄学派等现象）

#Prompt Engineering #大语言模型 #结构化表达 #过度推崇 #好好说话

迈克 Mike Chong

3周前

今天有朋友问我我还是用不用第三方的比如说prompt template？这是个好问题。我觉得如果你用ChatGPT的网页版的话是可以用，但是写代码的话我觉得如果用Codex已经用不着了。Codex我觉得不需要Claude Code那么多花活，它本身就是一个非常好的thinking model，除非是崭新的项目，否则我不做任何prompt engineering。

#ChatGPT #prompt template #Codex #Prompt Engineering #thinking model

lidang 立党（全网劝人卖房、劝人学CS、劝人买SP500和NASDAQ100第一人）

3个月前

我认为，这个时代的AI-native generation（AI原住民）应该做到以下几点： 1. 日常模模糊糊地关注各家厂商的LLM model，像旧时代关注手机和汽车评测的人们一样，看看发布会，看看benchmark，第一时间迫不及待地上手用一用； 2. 脑海中模模糊糊有信息论的观念，知道LLM不是算卦，不会指望万事万物让LLM 给一个标准答案，而是对prompt engineering有个轮廓的概念，知道充分给足什么条件和规则，才能让LLM输出一个可靠的答案； 3. 相信Agentic的方法，相信AI Agent，不迷信LLM本身能力，知道LLM一口气给一个结果一定会犯错，就像一个人用口算回答一个10位乘以10位的问题一样，知道LLM有幻觉，知道LLM如何用agentic的方法去调用外部工具，一步步解决问题； 4. 日常关注AI community，包括新产品、新模型、新的问题，看见以后愿意尝试用一用，或者试着思考一下这个东西是怎么做出来的； 5. 熟练使用SWE Agent（比如codex、openhands、claude code）和vibe coding工具（cursor、github copilot），模模糊糊知道工具和能力上限的轮廓，知道这些工具的作用是什么，同时也知道作为人类如何驾驶这类工具时必须具备的品质和能力，不迷信“AI能代替程序员”，而相信“熟练vibe coding是人的技能之一”； 6. 对日常问题的搜索和学习，习惯用perplexity或者快速提问，反复追问，而不仅仅是google，也等不及chatgpt慢悠悠的响应，明白AI时代最快、最顺手的搜索总结方法是什么； 7. 对于一个成体系的传统领域问题（比如EDA设计、传统建筑行业BIM、传统商业分析领域），模模糊糊知道如何搭建一个Agent或者workflow去自动化解决，或者提出一些新的方法，把传统问题转化成structured data，或者用AI Agent通过写程序和调用部分API来逐步解决，或者使用一些long term memory框架合理indexing，并且看到某些中老年高管一提及“用AI解决问题”，就盲目把几千页文档和数据一股脑喂进vector database然后进行高成本query的行为，感到生理性不适。

#AI原住民 #LLM #信息论 #Prompt Engineering

5个月前

看 YC 讲 prompt engineering 的分享，其中一个女生长得跟我前女友一模一样，吓我一大跳。

#YC #Prompt Engineering #分享会 #前女友 #相似

5个月前

今天尝试用 Claude4 创建一些 Infographic（就是很流行的信息图表）没有任何的微调，一个 prompt 直出，prompt 风格也是让大模型提供，我没有任何调整，发现真的很强，尽管有少许错位，但是想象力和风格都让我很满意和惊喜。我尤其喜欢第二张的赛博朋克风，里面还有函数名称啥的，很前卫。第三张的复古风都很棒。我还在想 prompt engineering 还存在吗？现在大模型能一下生成各种完美的提示词了。

#Claude4 #Infographic #信息图表 #大模型 #Prompt #赛博朋克 #复古风 #Prompt Engineering

马东锡 NLP 🇸🇪

7个月前

「LLM， Agent, RL的关系」在LLM的语境下，Agent是能理解问题，自主进行推理（Reasoning），并采取行动的系统。你可以把它想象成一个非常聪明的助手，当你提出复杂问题时，它不会立即给出答案，而是会在内心进行推理和规划（Planning），再给出最终决定。如果我们回顾prompt engineering中提高LLM Reasoning能力的方法，如Self-Consistency、Tree of Thoughts 和 ReAct，本质上都体现了强化学习（RL）中常见的规划思想： Tree of Thoughts：如同下棋时，你脑海中会形成一个思考树，一步步推演未来可能的局面，从而找到最优解。这与RL中的树搜索（Tree Search）方法完全对应，体现了明显的模型化规划（Model-based Planning）特征。 ReAct（Reasoning+Acting，推理加行动）：类似于你边思考边行动，不断尝试，再根据反馈调整下一步的计划。这种推理与行动的交替模式与RL中Agent持续地感知状态（Observing）、制定策略（Policy）、采取行动（Acting）并从环境中获得反馈（Feedback）非常类似。为什么增强LLM的Reasoning通常要使用RL方法？尽管LLM本身已经具备强大的知识和生成能力，但它们本质上是基于“下一个词预测”的机制（Next-Word Prediction），缺乏深度的Planning能力和对未来结果的有效预测。这就像一个聪明但缺乏系统训练的人，虽然懂得很多知识，但在面对复杂决策时容易陷入短视和错误。 RL方法的加入，就像给LLM提供了一种“内心世界模型”（Internal World Model），帮助模型进行更好的内部规划： RL能帮助LLM学会评估和预测不同推理路径的可能结果，从而选择更优的路径，恰如DeepSeek R1, Kimi, o1的方法。立一个FLAG, 把这些RL方法一个个用人话讲明白。

#LLM #agent #RL #reasoning #planning #Prompt Engineering #AI助手 #自主推理

7个月前

跟好朋友一起研发的课程终于快要上线了。一个教育平台，利用AI机器人，带大家一起学Prompt Engineering技术。这套课除了学方法，其实更想强调的是 AI First思维，从实践中学，提升逻辑思维，提升审美能力、提升「AI领导力」。把第一小节内容发给AI，提炼生成的几张海报：

#课程上线 #AI机器人 #Prompt Engineering #AI First思维 #逻辑思维 #审美能力 #AI领导力

8个月前

来自Google prompt engineering比赛冠军的经验总结最近Google举办的提示词工程比赛中，瑞典选手Joakim Jardenberg在300多名选手中脱颖而出。总结一下他提到的经验 - 首先是学习方法论，Jardenberg采用了一个简单但有效的迭代方法： 1. 将AI应用到所有可能的任务中； 2. 同时使用多个AI系统相互验证； 3. 保持开放和好奇心态，不预设边界； 4. 关注实际应用场景而非理论限制；可以类比学习一门新语言 - 你需要不断练习，在不同场景下使用，并且和不同的母语者交流。通过与多个AI系统互动，我们逐渐掌握了与AI对话的"语感"。他对prompt的具体建议也和我之前写过的建议很类似，核心观点是要把AI看作一个初级但有潜力的同事，而不是简单的软件工具。就像带新人一样 - 你需要给出清晰的指导，同时也要给他们思考和创新的空间。一些关键点: - AI和人一样需要明确的上下文和及时的反馈； - 不要过度约束，给AI发挥空间； - 用自然语言交流，避免过于形式化的提示词模板； - 持续跟踪AI能力的演进，及时调整交互策略；从实践角度看，这些建议本质上是在建立一个良好的合作关系。就像和新同事建立信任一样，了解对方的特点和能力，才能更好地协作。

#Google比赛 #Prompt Engineering #提示词工程 #Joakim Jardenberg #AI迭代方法

10个月前

One of the most powerful prompts to get Claude 3.5 Sonnet unstuck from a loop: "This isn't working. First, think for ten paragraphs about what's going on here + the best way to do this, and then implement the code."

#Claude 3.5 #AI Language Model #sonnet #Prompt Engineering #Loop Resolution